Clasificación de Páginas Web con Anotaciones Sociales

نویسندگان

  • Arkaitz Zubiaga
  • Raquel Martínez-Unanue
  • Víctor Fresno-Fernández
چکیده

User-generated annotations on social bookmarking sites can provide interesting and promising metadata for web page classification. These annotations include diverse types of information, such as tags and comments. Nonetheless, each kind of annotation has a different nature and popularity level. In this work, we analyze and evaluate the usefulness of each of these social annotations to classify web pages over a taxonomy like that by the Open Directory Project. We compare them separately to the content-based classification, and also combine the different types of data. Our experiments show encouraging results with the use of social annotations for this purpose, and we found that combining these metadata with web page content improves even more the classifier’s performance.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modelos para detectar la polaridad de los mensajes en redes sociales

Gracias a la expansión de la Web 2.0 y a la participación activa de los usuarios en redes sociales, blogs, foros y páginas dedicadas a críticas (reviews) en los últimos años, se ha visto un crecimiento exponencial de la información subjetiva disponible en Internet. Este fenómeno ha originado interés por detectar sentimientos, emociones y opiniones expresadas sobre tópicos u objetos diferentes. ...

متن کامل

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web

In this paper we present a study for semi-supervised multiclass web page classification using SVM. We propose not only combining binary semi-supervised classifiers, but also multiclass supervised ones. Our experiments show great performance for the latter method, where ignoring unlabeled documents could be better for some cases, using only labeled documents for the learning task, directly based...

متن کامل

Clasificación de servicios Web mediante una red neuronal artificial usando n-gramas de palabras

Resumen. Este artículo presenta un enfoque basado en n-gramas de palabras para la clasificación automática de servicios Web utilizando una red neuronal artificial de tipo perceptrón multicapa. Los servicios Web contienen información de gran utilidad para lograr una clasificación basada en la funcionalidad del mismo. El enfoque se basa en n-gramas de palabras extraídas de la descripción del serv...

متن کامل

Uso de ontologías en páginas web para mejorar su accesibilidad a invidentes

Resumen. Actualmente, la Web ofrece información disponible para las personas de forma muy heterogénea. Con la iniciativa de la Web semántica se persigue que el contenido de las páginas Web se disponga de forma que permita a personas y ordenadores “comprender” esta información, siguiendo esquemas comunes y consensuados mediante ontologías. Uno de los colectivos que más se puede favorecer de esta...

متن کامل

Sonificación de EEG para la clasificación de palabras no pronunciadas

Resumen. Las interfaces cerebro-computadora (BCI) basadas en electroencefalograma (EEG) son una alternativa que pretende integrar a las personas con discapacidad motriz severa a su entorno. Sin embargo, éstas aún no son utilizadas en la vida cotidiana por lo poco intuitivas que son las fuentes electrofisiológicas para controlarlas. Para tratar este problema, se han realizado trabajos con el obj...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 43  شماره 

صفحات  -

تاریخ انتشار 2009